By transferring knowledge from large, diverse, task-agnostic datasets, modern machine learning models can solve specific downstream tasks either zero-shot or with small task-specific datasets to a high level of performance. While this capability has been demonstrated in other fields such as computer vision, natural language processing or speech recognition, it remains to be shown in robotics, where the generalization capabilities of the models are particularly critical due to the difficulty of collecting real-world robotic data. We argue that one of the keys to the success of such general robotic models lies with open-ended task-agnostic training, combined with high-capacity architectures that can absorb all of the diverse, robotic data. In this paper, we present a model class, dubbed Robotics Transformer, that exhibits promising scalable model properties. We verify our conclusions in a study of different model classes and their ability to generalize as a function of the data size, model size, and data diversity based on a large-scale data collection on real robots performing real-world tasks. The project's website and videos can be found at robotics-transformer.github.io
translated by 谷歌翻译
成功培训端到端的深网进行真实运动去缩合,需要尖锐/模糊的图像对数据集,这些数据集现实且多样化,足以实现概括以实现真实的图像。获得此类数据集仍然是一项具有挑战性的任务。在本文中,我们首先回顾了现有的Deblurring基准数据集的局限性,从泛化到野外模糊图像的角度。其次,我们提出了一种有效的程序方法,以基于一个简单而有效的图像形成模型来生成清晰/模糊的图像对。这允许生成几乎无限的现实和多样化的培训对。我们通过在模拟对上训练现有的DeBlurring架构,并在四个真实模糊图像的标准数据集中对其进行评估,从而证明了所提出的数据集的有效性。我们观察到使用建议方法训练时动态场景的真实运动毛线照片的最终任务的出色概括性能。
translated by 谷歌翻译
在许多现实世界中,当不二维测量值时,可能会提供自由旋转3D刚体(例如卫星)的图像观察。但是,图像数据的高维度排除了学习动力学和缺乏解释性的使用,从而降低了标准深度学习方法的有用性。在这项工作中,我们提出了一个物理知识的神经网络模型,以估计和预测图像序列中的3D旋转动力学。我们使用多阶段预测管道实现了这一目标,该管道将单个图像映射到潜在表示同构为$ \ Mathbf {so}(3)$,从潜在对计算角速度,并使用Hamiltonian Motion使用Hamiltonian运动方程来预测未来的潜在状态博学的哈密顿人的代表。我们证明了方法对新的旋转刚体数据集的功效,该数据集具有旋转立方体和矩形棱镜序列,并具有均匀且不均匀的密度。
translated by 谷歌翻译
在过去的几年中,涉及AI驱动警察工作的歧视性做法一直引起了很多争议,Compas,Predpol和Shotspotter等算法被指控不公平地影响少数群体。同时,机器学习中的公平性,尤其是计算机视觉的问题,已经成为越来越多的学术工作的主题。在本文中,我们研究了这些区域如何相交。我们提供有关这些实践如何存在的信息以及减轻它们的困难。然后,我们检查目前正在开发的三个应用程序,以了解它们对公平性构成的风险以及如何减轻这些风险。
translated by 谷歌翻译
传统上,交通事故管理(TIM)计划协调紧急资源的部署到即时事件请求,而无需容纳环境中事件演变的相互依存关系。但是,忽略对环境中事件在当前部署决策的过程中的固有相互依赖性是短暂的,而由此产生的幼稚部署策略可能会大大恶化整个事件延迟对网络的影响。环境中事件进化的相互依存关系,包括事件事件之间的事件,以及在近未实现请求中的资源可用性与预期的即时事件请求期间的持续时间之间的相互依存关系,应在进行当前阶段部署时通过浏览模型来考虑决定。这项研究基于分布式约束优化问题(DCOP)开发了一个新的主动框架,以解决上述局限性,克服了无法适应TIM问题中依赖关系的常规TIM模型。此外,配制了优化目标以纳入无人机(UAV)。无人机在蒂姆(Tim)中的作用包括探索不确定的交通状况,检测出意外事件以及从道路交通传感器中增加信息。我们对多个TIM情景模型的鲁棒性分析显示了使用本地搜索启发式方法显示令人满意的性能。总体而言,我们的模型报告说,与常规TIM模型相比,总事件延迟的大幅减少。在无人机的支持下,我们证明了通过紧急车辆较短的响应时间的总体事件延迟进一步减少,并且与估计的事件延迟影响相关的不确定性减少。
translated by 谷歌翻译
我们提出了具有可拖动的对数密度的集合数据值数据的新型,有条件的生成概率模型。该模型是由置换模化动力学控制的连续归一化流。这些动力学是由可学习的每集元素项和成对相互作用的驱动的,均通过深神经网络参数化。我们通过应用程序说明了该模型的实用性,包括(1)以视觉上指定的地图信息为条件的复杂交通场景生成,以及(2)直接在图像上调节的对象边界框生成。我们借助罚款,可确保动力学平稳并因此有效解决,我们通过最大程度地提高标记有条件数据标记的条件数据的预期可能性来训练我们的模型。我们的方法在对数的可能性和特定于域特异性指标(越野,碰撞和违规违规)方面极大地超过了非渗透不变基线,从而产生了很难与真实数据区分的现实样本。
translated by 谷歌翻译
我们介绍了时间多模式的多模式学习,这是一个新的决策模型系列,可以间接学习和传输在线信息,同时观察一个概率分布,该概率分布有一个以上的峰值或一个以上的结果变量,从一个时间阶段到另一个时间阶段。我们通过基于数据生理学驱动的相关性依次删除不同变量和时间之间的其他不确定性来近似后部,以解决不确定性下的更广泛的挑战性时间依赖性决策问题。对现实世界数据集的广泛实验(即,城市交通数据和飓风整体预测数据)证明了拟议的有针对性决策的卓越性能,而不是各种设置的最先进的基线预测方法。
translated by 谷歌翻译
团体公平指标是评估基于预测决策系统公平性的既定方法。但是,这些指标仍然与哲学理论相关,其道德含义通常不清楚。我们提出了一个一般框架,用于分析基于分配正义理论的决策系统的公平性,包括与不同规范立场相对应的不同既定的“正义模式”。我们表明,最受欢迎的集体公平度量指标可以解释为我们方法的特殊情况。因此,我们为群体公平指标提供了一个统一和解释的框架,该框架揭示了与它们相关的规范性选择,并允许理解其道德实质。同时,我们提供了可能公平指标的延伸空间,而不是公平ML文献中当前讨论的指标。我们的框架还允许克服几个群体公平指标的局限性,这些指标在文献中受到批评,最著名的是(1)它们是基于平等的,即他们要求群体之间的某种形式的平等性,这有时可能有害于边缘化。组,(2)他们仅比较跨群体的决策,但对这些群体的后果没有比较,并且(3)分配正义文献的全部广度不足。
translated by 谷歌翻译
在这项应用研究努力中,已经探讨了在这种应用的研究中探讨了加剧或减少种族系统性不公正的各种形式的人工智能。在调查使用算法以自动化在种族敏感环境中的人为决策中,已经利用了识别,分析和辩论系统问题的每个主题问题。通过分析历史全身模式,隐含偏差,现有算法风险以及基于自然语言处理的AI(例如风险评估工具)的法律影响,已经断言,例如风险评估工具,具有种族歧视的结果。得出结论,需要更多的诉讼政策来规范和限制内部政府机构和公司如何利用算法,隐私和安全风险以及审计要求,以便与过去的种族不公正结果和实践分歧。
translated by 谷歌翻译
截至较晚的许多域名正在使用人工智能,法律制度也不例外。然而,正如现在所掌握的那样,来自美国最高法院(Scotus)的法律文件的良好注释数据集的数量非常有限。尽管最高法院裁决是公共领域的知识,但由于需要手动收集和处理每次划痕的数据,因此尝试与他们有意义的工作成为更大的任务。因此,我们的目标是创建Scotus法庭案件的高质量数据集,以便可以随时用于自然语言处理(NLP)研究和其他数据驱动应用程序。此外,NLP的最新进展为我们提供了构建可用于揭示影响法院决策的模式的预测模型的工具。通过使用先进的NLP算法来分析以前的法庭案件,训练有素的模型能够预测和分类法院的判断,鉴于原告和被告的文本格式的事实;换句话说,该模型正在通过产生最终判决来模拟人类陪审团。
translated by 谷歌翻译